FILTER MODE ACTIVE

#масштабируемые модели рассуждения

Найдено записей: 1

#масштабируемые модели рассуждения27.06.2025

Polaris-4B и Polaris-7B: масштабируемое обучение с подкреплением для продвинутого математического и логического рассуждения

Polaris-4B и Polaris-7B представляют новый рецепт обучения с подкреплением, который эффективно масштабирует способности к рассуждению, достигая передовых результатов в математических тестах с использованием небольших моделей.